编译 | AI科技大本营(ID:rgznai100)构建涉及图像、文本和表格数据集的机器学习应用并不容易。它需要特征工程或使用数据领域知识来创建使AI算法起作用的特征,还需要进行大量数据预处理,以确保训练模型时不会出现偏差。
这大概就是为什么亚马逊开发了AutoGluon,这是一个开放源代码库,旨在使开发人员仅用几行代码即可编写AI嵌入的应用程序。它已经在GitHub上公开发布。https://github.com/awslabs/autogluon/AutoGluon旨在使开发者对历来不得不做出的许多决策进行自动化。通常,诸如超参数调整之类的任务需要手动执行,这就要求科学家预测超参数(表示构建AI模型时所做的选择)将如何影响模型训练。另一个通常由人监督的任务称为神经架构搜索,它涉及复杂的工程,至少在一定程度上,开发人员必须为其各自的模型确定最优设计。为此,AutoGluon可以通过自动调整默认范围内的选择来生成仅需三行代码的模型,而这些默认范围在已知范围内可以很好地完成特定任务。开发者只需指定他们准备好其训练好的模型,作为响应,AutoGluon就会利用可用的计算资源在分配的运行时中找到最强模型。它以亚马逊和微软三年前的研究工作Gluon为基础,后来又在Apache MXNet和微软的Cognitive Toolkit中发布。Gluon是一个机器学习界面,允许开发者使用一组预先构建和优化好的组件来构建模型,而AutoGluon则端到端地处理开发过程。
AutoGluon“开箱即用”,用于识别表格预测、图像和文本分类以及对象检测的模型,它还提供了API可供经验丰富的开发者使用,以进一步改善模型的预测性能。它需要Python 3.6或3.7版本,并且目前仅支持Linux,但是Amazon表示Mac OSX和Windows版本将很快公布。
“我们开发了AutoGluon,以真正使机器学习平民化,并将深度学习的能力提供给所有开发者。” AWS应用科学家Jonas Mueller在一份声明中表示,“ AutoGluon解决了这个问题,因为所有的选择都自动调优到默认范围内,对于特定的任务和模型,默认范围内的性能都很好。”AutoGluon的首次亮相是在对Amazon Web Services(AWS)的SageMaker进行重大升级后,该工具包用于不断训练机器学习模型并将其部署到云和边缘环境。AWS SageMaker Studio是一种模型训练和工作流管理工具,可将用于机器学习的所有代码、笔记和文件收集到一个地方,而SageMaker Notebook可让开发者快速启动Jupyter笔记来进行机器学习项目。还有SageMaker Autopilot,可通过自动选择算法并调整模型来自动创建模型。SageMaker Experiments,用于测试和验证模型;SageMaker Debugger,可提高模型的准确性;SageMaker Model Monitor,可以检测概念偏差。亚马逊先前推出了AWS深度学习容器(AWS Deep Learning Containers),这是一个预先安装了流行深度学习框架的Docker映像库,以及一系列完全托管服务,包括Personalize,Textract,Fraud Detector和CodeGuru。再加上AutoGluon这样的独立工具,根据Statista的数据,亚马逊正在追逐一个到2025年预期为1180.6亿美元的市场。https://autogluon.mxnet.io/
原文链接:
https://venturebeat.com/2020/01/09/amazons-autogluon-produces-ai-models-with-as-little-as-three-lines-of-code/
(*本文为AI科技大本营编译文章,转载请微信联系1092722531)
点击阅读原文,或扫描文首贴片二维码
所有CSDN 用户都可参与投票和抽奖活动
加入福利群,每周还有精选学习资料、技术图书等福利发送